Aula 1 - O curso e o mundo dos dados

R de Trás-pra-frente

Carolina Musso

PROFESP, DEMSP, MS

Aula de Hoje

  1. Apresentação do curso

  2. Introdução ao mundo dos dados

O curso R-de-trás pra frente

  • Três módulos:

    1. Introdução a Linguagem R

    2. Trabalhando os dados

    3. Apresentando as análises

  • Cada módulo tem um mês (4 semanas), cada semana tem três video-aulas.

  • Ao final de cada módulo uma tarefa que -> compõe a tarefa principal final

  • Exercícios de fixação ao final de cada aula

Porque chama “de-trás-pra-frente”?

  • Desde as primeiras aulas, vamos ver “códigos rodando”.

  • Trabalhar de forma intuitiva e ir definindo os conceitos ao longo do curso.

rm(list=ls()) #limpa o ambiente

#Carrega os pacotes
if (!require(pacman)) install.packages("pacman") 
pacman::p_load(tidyverse, data.table, flextable, officer)

Nossa bibliografia

A primeira semana:

  1. Apresentação do curso e bases de dados

  2. Introdução ao R e RStudio: intalação e apresentação do software

  3. Motivação: Porque trabalhar com o R e não outro software?

Aula de hoje …

Introdução ao mundo dos dados.

  • A base de tudo que vamos falar

  • Vamos pensar de um ponto de vista mais abrangente

  • O que é trabalhar com os dados?

    • Evidências

    • Saber extrair, interpretar e visualizar a partir de muitos números.

Base de dados

  • Diferença de um banco de dados: servidor e gestão dos dados.

  • Cuidado necessário com os dados

  • Já ouviu e expressão: Entra lixo … sai lixo

    • Como ter dados arrumados?

Planilhas

Dados organizados

  • O que é bom para a máquina ler x bom para humanos lerem

  • Capítulo 4 livro

  • O ideal para análise:

    • Cada linha uma observacão

Mais exemplos

Mas se eu não tiver dados “arrumados”

  • Sempre vai precisar arrumar alguma coisa.

  • Nem tudo está perdido, mas!

    • Vai dar mais trabalho e requer mais habilidades.
  • Então vamos focar em deixar o mais arrumado possível desde o começo!

  • No curso usaremos dados secundários (ou seja, já foram coletados por outras pessoas): note que eles estarão quase sempre nesse formato!

Exercício

  • No exercício de hoje vocês terão alguns questionários que foram preenchidos. A tarefa será passar esses dados para o Excel de forma que os dados fiquem arrumados de maneira ideal para as análises.

  • Lembre-se: cada linha é uma observação (pessoa) e cada coluna é uma variável (atributo medido) de forma que cada célula do Excel contenha um único valor!

  • Conclua o excercício e compare com o gabarito para avançar para a próxima aula!

  • Faça comentários no forum sobre problemas identificados nessa coleta de dados e como melhora-la.

Por hoje é só!